摘要。人们对采用基于 Transformer 的架构进行医学图像分割的兴趣日益浓厚。然而,由于缺乏大规模带注释的医学数据集,要实现与自然图像相当的性能具有挑战性。相比之下,卷积网络具有更高的归纳偏差,因此很容易训练到高性能。最近,ConvNeXt 架构试图通过镜像 Transformer 块来现代化标准 ConvNet。在这项工作中,我们在此基础上进行了改进,设计了一种现代化且可扩展的卷积架构,以应对数据稀缺的医疗环境的挑战。我们推出了 MedNeXt,这是一个受 Transformer 启发的大核分割网络,它引入了 - 1)用于医学图像分割的完全 ConvNeXt 3D 编码器-解码器网络,2)残差 ConvNeXt 上采样和下采样块以保持跨尺度的语义丰富性,3)一种通过上采样小核网络迭代增加核大小的新技术,以防止在有限的医疗数据上出现性能饱和,4)在 MedNeXt 的多个级别(深度、宽度、核大小)上进行复合缩放。这使得它在 CT 和 MRI 模态和不同数据集大小的 4 个任务上实现了最佳性能,代表了一种现代化的医学图像分割深度架构。我们的代码已公开发布:https://github.com/MIC-DKFZ/MedNeXt。
主要关键词
![arXiv:2303.09975v5 [ed.IV] 2024 年 6 月 2 日PDF文件第1页](/bimg/7/7628994ff2b8a182b74bab7a379cc16dbd9b94f4.webp)
![arXiv:2303.09975v5 [ed.IV] 2024 年 6 月 2 日PDF文件第2页](/bimg/2/29c64941d028b8c12691a8794ebd55edfb1a4bb4.webp)
![arXiv:2303.09975v5 [ed.IV] 2024 年 6 月 2 日PDF文件第3页](/bimg/4/480699e47e459b9dad36ae7aba5d1ccc87acd0b3.webp)
![arXiv:2303.09975v5 [ed.IV] 2024 年 6 月 2 日PDF文件第4页](/bimg/b/b21eeb9df4271d7668bf6a050d4020336b527587.webp)
![arXiv:2303.09975v5 [ed.IV] 2024 年 6 月 2 日PDF文件第5页](/bimg/1/1ed20dc825d890fc2b3c89c0a6de1ffaee5679e8.webp)
